关于浮点型精度问题的一些理解

这是一篇关于浮点型精度的文章，大致会从三个大的问题入手，去解析精度问题。

字符串转浮点型出现精度丢失
浮点型和浮点型操作精度丢失
NSDecimalNumber如何解决精度丢失

前言

4月21号终于完成了4月份的自考，也有些时间来研究一些东西，写写博客了，刚好群里边有人问关于浮点型精度的问题，我去研究了一些资料，问了一些前辈和同行，总结如下，结尾处会有我参考资料的链接。(以下内容均是基于32位系统进行描述的)

字符串在内存中的存储方式

首先，我们了解一下字符串的存储方式，它是以ASCII码进行存储的，然后将对应的ASCII码转换成二进制存储在内存中。

例如：a对应的ASCII码是97，97对应的七位二进制表示是1100001，八位是01100001，这两者区别可以忽略掉，八位二进制可表示的字符范围更宽泛而已。因为是一个字符所以只需要1个字节，也就是8位，也就是1组二进制。

1.23作为一个字符串它由4个字符组成所以需要4个字节，也就是32位，需要4组二进制。它们分别对应的ASCII码是49、46、50、51，转换成二进制就分别是110001、101110、110010、110011。

浮点型在内存中的存储方式

浮点型作为一种与整型不同的存储方式，它是遵循IEEE754标准的。浮点型在内存中的存储分为了3个部分，分别是1个符号位s，8个指数E，23个有效数字M。任意一个二进制数V都可以写成sM*2^E，s就是正号和负号，M就是有效数字，E就是指数。这个公式的意思是将M的小数点向右移E位。下面是IEEE754的一些规定：

1. 当s=0，V为正数；当s=1，V为负数。
2. M表示有效数字，大于等于1，小于2。
3. 2^E表示指数位。
4. E的真实值必须再减去一个中间数，对于8位的E，这个中间数是127。
5. 在计算机内部保存M时，默认这个数的第一位总是1，因此可以被舍去，只保存后面的xxxxxx部分。

例如浮点数10.0，转换成二进制是1010，在32位系统下你还要在前面补上28个0，这个二进制并不是在内存中的存储样式。套用上面的公式你可以写成+1.010*2^3，其中s是0，那么也就是+，M就是1.01，E就是3。这只是公式，并不是在内存中的真正存储形式。接下来看下下面的图，图中的数值不用看，跟本文无关，主要是看组成的三部分。

看过了上图，还是以+1.010*2^3为例，将其填入该32位的二进制中。

首先是符号位S，也就是图中的sign，因为是正号，所以sign是0；
E是3，按第4条规则，E的真实值需要E+127，也就是130，将其转成二进制存储，也就是10000010；
M是1.010，按上述第5条规则，舍去1，也就是01000000000000000000000；
所以合在一起，浮点数10.0在内存中的表示就是01000001001000000000000000000000。

整型在内存中的存储方式

既然浮点型和字符串在内存中的存储方式都说了，顺道提下整型在内存中的存储方式。

这个很简单，它只需要考虑一个问题，就是正数和负数，它由两部分构成，第一个还是符号位，表示正负，后面31位都是实际存储的数字，所以它支持存储的数字范围是-2^31~~~2^31-1。只需要直接将整数转换成二进制就可以了。

比如100，在内存中的二进制表示就是00000000000000000000000001100100。

字符串转浮点型出现精度丢失

前面说了字符串的存储方式和浮点型的存储方式，现在这个问题其实挺好解决的了。对了，还要说的一点是，你用的什么方法进行强转的，对于NSString类型的转成float，一般使用的是floatValue方法，那么可以看下官方文档对这个方法的解读。

1
2
3

The floating-point value of the string as a float.
This property doesn’t include whitespace at the beginning of the string. This property is HUGE_VAL or –HUGE_VAL on overflow, 0.0 on underflow. This property is 0.0 if the string doesn’t begin with a valid text representation of a floating-point number.
This method uses formatting information stored in the non-localized value; use an NSScanner object for localized scanning of numeric values from a string.

上文比较有用的信息就是这个方法是通过NSScanner对字符串进行逐个扫描，如果不是一个真正的浮点型，比如@”abv”这种，这个方法就是0.0；如果是@”1.23”这种，它就会转化成浮点型1.23。所以可以排除掉这个可能：浮点型和字符串在内存中的二进制表现形式不同而导致的。

那么，问题就很清楚了，肯定是浮点型自身存储成2进制的时候发生了精度丢失。这次举两个例子对比下：

浮点数10.0，它的有效数字M是1.010，忽略掉整数位1，实际存储的也就3位是010，在32位情况下，M最多可以存储23位有效数，所以它是无损的。
浮点数1.2，它的有效数字是0011001100110011001100110011001100110011001100110011，这个长度大大超过了23位能存储的，所以它会被截取掉后面超出的部分，超出部分明显不全是0，所以会对它的精度造成损失。
总结：精度损失不损失需要看十进制的数据能否精确的转换为二进制。

浮点型和浮点型操作精度丢失

关于这个问题，其实看懂了上面的内容，就知道这个问题出在哪里了。比如a=b+c;首先浮点型b和c自身存储就已经损失精度了，其次得到的结果a如果也是一个不能精确转为二进制的浮点型，那么必然造成精度的2次缺失，会跟你想象中的结果差距更大。

NSDecimalNumber如何解决精度丢失

找到了问题的产生原因，再来说说iOS提供的NSDecimalNumber这个类如何解决这个问题。我们先来看下系统文档：

NSDecimalNumber, an immutable subclass of NSNumber, provides an object-oriented wrapper for doing base-10 arithmetic. An instance can represent any number that can be expressed as mantissa x 10^exponent where mantissa is a decimal integer up to 38 digits long, and exponent is an integer from –128 through 127.

上述大概意思是NSDecimalNumber是NSNumber的一个子类，它提供了一个基于10进制面向对象的封装。它也有一个类似IEEE754的公式：N*M*10^E

例如浮点型1.23，套用上面公式就是1*123*10^(-2)。它会将这个浮点型包装成一个NSDecimalNumber对象，N代表是正数还是负数，在本例中是1，M代表将浮点型转化为整数后的数，在本例中是123，E代表指数，在本例中是-2。

这样来看，系统的处理方式其实很明显了，这个类不存储浮点型，只存储整数，自然避免了IEEE754那种方式的精度损失，当然类在内存中肯定跟浮点型是不同的，但是M这个属性保存的是整数型，是同浮点型一样都是基础数据类型。

后续

其实还有一个整型强转浮点型的问题，这个问题跟字符串转浮点型的情况还是不同的，这个是因为两者对二进制的转化方式不同。整型存储在内存中是直接转化成二进制的，浮点型虽然也是转成二进制存储，但它需要符合IEEE754标准，所以你直接把整型的二进制取出来当浮点型使用，肯定会出现对应的问题。

前言